覆盖主要内容
版本: 下个版本

2020年一线城市天气数据分析

案例数据

案例数据下载:

天气数据.xlsx

案例数据说明

案例数据为2020年一线城市天气数据,字段说明如下:

字段说明
date日期
ceilTemp最高温
floorTemp最低温
weather天气
windOrient风向
area城市
airQuaRate空气质量
airQuaRank空气等级
windRank风力等级

案例目标

  1. 分析四个城市每个月的最高温和最低温的平均气温
  2. 分析四个城市一年中,每天的温度分布情况
  3. 分析四个城市一年中空气质量的分布情况
  4. 分析污染天气在季节上的分布规律
  5. 探寻“空气质量”的影响因素
  6. 对北京差天气的原因分析

1. 分析四个城市每个月的最高温和最低温的平均气温

  1. 分析:使用字段【date】,【area】,【ceilTemp】,【floorTemp】,使用折线图展示2020年1月到12月的最高温和最低温的平均气温趋势

  2. 字段【date】是字符串类型,需要使用计算字段转为日期类型:DATEPARSE([date],'yyyy-mm-dd')

  1. 标记改为“线”

  2. 将计算字段【日期】拖到列并按“月”拆分,将【ceilTemp】和【floorTemp】拖动到行并将其聚合方式改为平均

  1. 将【area】拖动到标记“颜色”

2. 分析四个城市一年中,每天的温度分布情况

  1. 分析:使用计算字段【日期】,字段【area】,【ceilTemp】,【floorTemp】,使用气泡图展示2020年每天的最高温和最低温的分布

  2. 将标记设为“圆”

  3. 将计算字段【日期】拖到列并按“日”拆分,将【ceilTemp】和【floorTemp】拖动到行并将其聚合方式改为平均

3. 分析四个城市一年中空气质量的分布情况

  1. 分析:使用计算字段【计数-空气质量】,字段【area】,【airQuaRank】,使用堆叠条图展示
  2. 创建计算字段【计数-空气质量】:COUNT([airQuaRank])

  1. 工作表右侧基本图表中选择堆叠条图
  2. 拖动字段
  3. 点击标记中的颜色,编辑颜色

4. 分析污染天气在季节上的分布规律

  1. 分析:使用计算字段【天数】,【日期】,字段【area】,【airQuaRank】,使用折线图展示趋势
  2. 创建计算字段【天数】:COUNT([date])

  1. 拖动字段,其中【日期】按“季度”拆分
  2. 使用筛选器,筛选空气质量中包含污染的数据

5. 探寻“空气质量”的影响因素

  1. 分析:使用计算字段【温差】,字段【windRank】,【area】,【airQuaRank】,使用折线图展示趋势
  2. 创建计算字段【温差】:[ceilTemp]-[floorTemp]
  3. 拖动字段
  4. 度量的聚合方式设置为平均
  5. 从结果分析原因:温差越大可能空气质量越好,风级越大可能空气质量越好

6. 对北京差天气的原因分析

  1. 分析:使用计算字段【温差】,字段【windRank】,【area】,【airQuaRank】,使用条形图比较

  2. 从结果分析:

    1. 虽然和空气质量相关性最高的是风力等级,但不是造成北京空气质量较差的主要原因
    2. 北京的空气质量较差是因为北京的最低温度和温差比上海、广州、深圳都要大很多

制作仪表盘

  1. 查看仪表盘

案例总结

本案例对天气数据进行分析,使用条形图、折线图、气泡图等进行可视化探索分析,使用筛选器和颜色设置,分析结果通过仪表盘进行展示。